課程資訊
課程名稱
機器學習與資料分析在會計領域之應用
Machine Learning and Data Analytics in Accounting 
開課學期
110-2 
授課對象
學程  商業資料分析學分學程  
授課教師
蔡彥卿 
課號
Acc5053 
課程識別碼
722 U9050 
班次
 
學分
3.0 
全/半年
半年 
必/選修
選修 
上課時間
星期一10,A,B(17:30~20:10) 
上課地點
管一大電腦 
備註
本課程無須程式語言背景。
限本系所學生(含輔系、雙修生) 且 限學士班四年級以上
總人數上限:50人 
Ceiba 課程網頁
http://ceiba.ntu.edu.tw/1102Acc5053_ACC_ML 
課程簡介影片
 
核心能力關聯
核心能力與課程規劃關聯圖
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

本課程以機器學習模型在實際會計上之案例為基礎,使學生能在實際操作中學習在會計議題上常用之機器學習模型。 

課程目標
以會計個案方式使沒有程式設計經驗的學生能具備應用常見之資料分析及機器學習方法的能力;希望藉由此一方式協助建立學生能繼續深入研究會計領域議題之基本科技能力。本課程以會計議題引導學生在實作中理解機器學習之原理,已經修習過機器學習模型的學生對本課程應能駕輕就熟,但本課程目的是讓毫無相關經驗的會計學系或研究所的學生透過各項基本會計議題學習如何應用各種機器學習模型研究會計議題。 
課程要求
4個作業(5選4),以及期末報告。 
預期每週課後學習時數
 
Office Hours
備註: 周一17:00-17:30 
指定閱讀
無 
參考書目
無 
評量方式
(僅供參考)
 
No.
項目
百分比
說明
1. 
4個作業 
72% 
作業5選4 
2. 
期末報告 
28% 
 
 
課程進度
週次
日期
單元主題
第1週
2/14  課程介紹: 資料分析、機器學習及會計 
第2週
2/21  Python 基礎
• Python基本操作
• 小作業(不計分、無需繳交): 月營收時間序列圖、平減後月營收時間序列圖及基本統計量
 
第3週
2/28  國定假日 
第4週
3/07  (計畫一) EPS預測之會計理論與機器學習模型介紹
• 會計學相關理論(Oh and Penman (1989) )
• 我國會計準則變動與資料選擇
• 資料梳理、基本統計量及資料平減問題
• 權益變動下EPS跨期間預測之困擾
• 隨機森林與XGboost classifier簡介
• 三種可能預測方式介紹: EPS預測與一般機器學習問題之差異?
• 討論其他可能之預測方式
• 下周練習之程式中,各項參數介紹與overfitting問題之討論 
第5週
3/14  (計畫一) EPS預測之程式介紹及作業1
• 原始資料及程式
• 資料梳理問題: Python與Excel
• 助教mp4講解程式(1周前在NTU COOL中發布)
• 學生實際操作程式(上課中實作;有問題助教可立刻協助)
• 作業1-1: 2017年EPS預測。下周一17:00繳交,下周一17:00發布參考答案(程式修改部分)。 
第6週
3/21  (計畫一) EPS預測作業2
• 擬定一個會計問題,並修改程式及完成預測;另有資料視覺化練習(應用第2周程式即可)。
• 規定之議題;亦可自行擬定議題
• 作業2: 完成規定之議題,或完成自行擬定更複雜問題。 
第7週
3/28  (計畫二) 內稽、內控或審計問題: Fraud detection-研究業務員舞弊之案例
• Fraud detection及financial distress prediction之會計研究簡介
• Imbalanced data問題探討
• 本計畫之業務員舞弊個案及資料介紹
• 此類資料通常應有之視覺化介紹
• 隨機森林、XGboost classifier、logit、Support Vector Machine及Neural Network models
• 介紹Stacked models (本計畫將觀察同時使用多模型預測結果加權之預測,是否顯著優於各單一模型):
- Base Models: 選自前述各項模型
- Meta-Model: 將使用simple linear model (blending) 
第8週
4/04  第8週 (計畫二) 內稽、內控或審計問題: Fraud detection-研究業務員舞弊之案例
• 原始資料及程式
• 助教mp4講解程式(1周前在NTU COOL中發布)
• 學生實際操作程式(上課中實作;有問題助教可立刻協助) 
第9週
4/11  (計畫二) 內稽、內控或審計問題: Fraud detection-研究業務員舞弊之案例
• 規定之問題: 新資料集、修改程式及完成預測;另有資料視覺化練習。
• 作業3: 完成規定之議題,或完成自行擬定更複雜問題。 
第10週
4/18  (計畫三) 月營收預測
• 前兩計畫之三模型,再加上Deep Neural Network (DNN) and Recurrent Neural Network (RNN)
• 資料視覺化、基本統計量與資料平減問題
• 行業別問題
• 總體變數: 匯率 
第11週
4/25  (計畫三) 月營收預測
• 原始資料及程式
• 助教mp4講解程式(1周前在NTU COOL中發布)
• 學生實際操作程式(上課中實作;有問題助教可立刻協助) 
第12週
5/02  (計畫三) 月營收預測
• 規定之問題、修改程式及完成預測;另有資料視覺化練習。
• 作業4: 完成規定之議題,或完成自行擬定更複雜問題。 
第13週
5/09  (計畫四) 致股東報告書內容與股價報酬關聯性之研究
• 網路爬蟲與相關資料
• 股價報酬與Sentiment Analysis 
第14週
5/16  (計畫四) 致股東報告書內容與股價報酬關聯性之研究
• 原始資料來源及程式
• 助教mp4講解程式(1周前在NTU COOL中發布)
• 學生實際操作程式(上課中實作;有問題助教可立刻協助) 
第15週
5/23  (計畫四) 致股東報告書內容與股價報酬關聯性之研究
• 規定之問題、修改程式及完成預測;另有資料視覺化練習。
作業5: 完成規定之議題,或完成自行擬定更複雜問題。 
第16週
5/30  (計畫五: 延續計畫三,在模型中增加聲量或情緒變數) 使用APIs收集網路聲量(II)及Sentiment Analysis之應用: 網路聲量與情緒是否可以增加月營收預測之準確性?  公告月營收增減幅較為巨大之公司,網路聲量與情緒,是否在公告日前有異常之情形? 助教以mp4講解程式。 
第17週
6/06  第17週 期末報告
自擬題目並在16周之前與任課教師商議: 可利用課程中5項計畫之基本資料,再作進一步研究,亦可自擬任何與會計相關之議題。 
第18週
6/13  期末報告